智能论文笔记

Learning Transductions to Test Systematic Compositionality

Josef Valvoda , Naomi Saphra , Jonathan Rawski , Ryan Cotterell , Adina Williams

分类：自然语言处理

2022-08-17

将已知的原始概念重组为更大的新型组合是一种典型的人类认知能力。NLP中的大型神经模型是否在从数据中学习时获得此能力是一个悬而未决的问题。在本文中，我们从形式语言的角度看一下这个问题。我们使用确定性有限状态传感器来制作具有控制组合性的可控属性的无限数量数据集。通过对许多传感器进行随机采样，我们探讨了它们的哪些属性（状态数，字母大小，过渡次数等）有助于通过神经网络的组成关系可学习。通常，我们发现模型要么完全学习关系。关键是过渡覆盖范围，以每个过渡为400个示例设置软可学习性限制。

translated by 谷歌翻译

Linear Connectivity Reveals Generalization Strategies

Jeevesh Juneja , Rachit Bansal , Kyunghyun Cho , João Sedoc , Naomi Saphra

分类：机器学习 | 自然语言处理

2022-05-24

在模式连通性文献中被广泛接受的是，当两个神经网络在相同的数据上类似地训练时，它们通过路径通过参数空间连接，维持了测试集精度。在某些情况下，包括从预验证的模型中转移学习，这些路径被认为是线性的。与现有结果相反，我们发现在文本分类器（在MNLI，QQP和COLA上训练）中，一些填充模型具有较大的障碍，它们之间的线性路径之间的损失越来越大。在每个任务上，我们都会发现模型的不同簇，这些模型簇在测试损失表面上是线性连接的，但与集群外部的模型断开 - 模型占据了表面上的单独盆地。通过测量专门制作的诊断数据集的性能，我们发现这些簇对应于不同的概括策略：一个群集的行为就像域移动下的一袋单词模型一样，而另一个群集使用句法启发式方法。我们的工作表明，损耗表面的几何形状如何指导模型朝着不同的启发式函数。

translated by 谷歌翻译

Learning Interpretable Dynamics from Images of a Freely Rotating 3D Rigid Body

Justice Mason , Christine Allen-Blanchette , Nicholas Zolman , Elizabeth Davison , Naomi Leonard

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-23

在许多现实世界中，当不二维测量值时，可能会提供自由旋转3D刚体（例如卫星）的图像观察。但是，图像数据的高维度排除了学习动力学和缺乏解释性的使用，从而降低了标准深度学习方法的有用性。在这项工作中，我们提出了一个物理知识的神经网络模型，以估计和预测图像序列中的3D旋转动力学。我们使用多阶段预测管道实现了这一目标，该管道将单个图像映射到潜在表示同构为$ \ Mathbf {so}（3）$，从潜在对计算角速度，并使用Hamiltonian Motion使用Hamiltonian运动方程来预测未来的潜在状态博学的哈密顿人的代表。我们证明了方法对新的旋转刚体数据集的功效，该数据集具有旋转立方体和矩形棱镜序列，并具有均匀且不均匀的密度。

translated by 谷歌翻译

Taking a Language Detour: How International Migrants Speaking a Minority Language Seek COVID-Related Information in Their Host Countries

Ge Gao , Jian Zheng , Eun Kyoung Choe , Naomi Yamashita

分类：自然语言处理

2022-09-07

在公共危机时期，寻求信息对于人们的自我保健和福祉至关重要。广泛的研究调查了经验理解和技术解决方案，以促进受影响地区的家庭公民寻求信息。但是，建立有限的知识是为了支持需要在其东道国发生危机的国际移民。当前的论文对居住在日本和美国（n = 14）的两名中国移民（n = 14）进行了访谈研究。参与者反思了他们在共同大流行期间寻求经验的信息。反思补充了两周的自我追踪，参与者保持了相关信息寻求实践的记录。我们的数据表明，参与者经常绕开语言绕道，或访问普通话资源以获取有关其东道国疫情爆发的信息。他们还进行了战略性利用普通话信息，以进行选择性阅读，交叉检查以及对日语或英语的共同信息的上下文化解释。尽管这种做法增强了参与者对共同相关信息收集和感官的有效性，但他们有时会通过有时认识的方式使人们处于不利地位。此外，参与者缺乏对审查以移民为导向的信息的认识或偏爱，尽管该信息可用，这些信息是由东道国公共当局发布的。在这些发现的基础上，我们讨论了改善国际移民在非本地语言和文化环境中寻求共同相关信息的解决方案。我们主张包容性危机基础设施，这些基础设施将吸引以当地语言流利程度，信息素养和利用公共服务的经验的不同水平的人们。

translated by 谷歌翻译

Deep Learning-based Segmentation of Pleural Effusion From Ultrasound Using Coordinate Convolutions

Germain Morilhat , Naomi Kifle , Sandra FinesilverSmith , Bram Ruijsink , Vittoria Vergani , Habtamu Tegegne Desita , Zerubabel Tegegne Desita , Esther Puyol-Anton , Aaron Carass , Andrew P. King

分类：计算机视觉

2022-08-05

在许多低到中型收入（LMIC）国家中，超声用于评估胸腔积液。通常，积液的程度是由超声检查员手动测量的，导致明显的内部/观察者间变异性。在这项工作中，我们研究了深度学习（DL）以自动化超声图像中胸腔积液分割的过程。在在LMIC设置中获得的两个数据集上，我们使用NNU-NET DL模型获得了中位骰子相似性系数（DSC）为0.82和0.74。我们还研究了DL模型中坐标卷积的使用，发现这会导致第一个数据集的中间DSC在0.85上的统计学显着改善，而第二个数据集则没有显着更改。这项工作首次展示了DL在LMIC环境中超声评估的过程中自动化的潜力，在LMIC环境中，通常缺乏经验丰富的放射科医生来执行此类任务。

translated by 谷歌翻译

Decentralized Learning With Limited Communications for Multi-robot Coverage of Unknown Spatial Fields

Kensuke Nakamura , María Santos , Naomi Ehrich Leonard

分类：机器人

2022-08-03

本文为一组移动机器人提供了一种算法，可以同时学习域上的空间字段，并在空间上分发自己以最佳覆盖。从以前的方法通过集中式高斯过程估算空间场的方法，这项工作利用了覆盖范围问题的空间结构，并提出了一种分散的策略，其中样本通过通过Voronoi分区的边界来建立通信在本地汇总。我们提出了一种算法，每个机器人都通过其自身测量值和Voronoi邻居提供的局部高斯流程运行局部高斯过程，该过程仅在提供足够新颖的信息时才将其纳入单个机器人的高斯过程中。在模拟中评估算法的性能，并与集中式方法进行比较。

translated by 谷歌翻译

The Wheelbot: A Jumping Reaction Wheel Unicycle

A. René Geist , Jonathan Fiene , Naomi Tashiro , Zheng Jia , Sebastian Trimpe

分类：机器人

2022-07-14

释放机将现成的组件与3DPrinting结合在一起，是一种对称的反应轮独轮车，可以从任何初始位置从任何初始位置跳到其车轮上。船轮凭借非独立和散发不足的动力学以及两个耦合的不稳定自由度，为非线性和数据驱动的控制研究提供了一个具有挑战性的平台。本文介绍了车轮的机械和电气设计，其估计和控制算法以及实验在平衡时表明自我的和干扰的拒绝。

translated by 谷歌翻译

One More Step Towards Reality: Cooperative Bandits with Imperfect Communication

Udari Madhushani , Abhimanyu Dubey , Naomi Ehrich Leonard , Alex Pentland

分类： (统计)机器学习 | 机器学习

2021-11-24

合作匪徒问题越来越多地成为其在大规模决策中的应用。然而，对此问题的大多数研究专注于具有完美通信的环境，而在大多数现实世界分布式设置中，通信通常是随机网络，具有任意损坏和延迟。在本文中，我们在三个典型的真实沟通场景下研究了合作匪徒学习，即（a）通过随机时变网络的消息传递，（b）通过随机延迟的网络瞬时奖励共享（c ）通过对冲损坏的奖励来传递消息，包括拜占庭式沟通。对于每个环境中的每一个，我们提出了实现竞争性能的分散算法，以及在发生的群体后悔的近乎最佳保证。此外，在具有完美通信的环境中，我们提出了一种改进的延迟更新算法，其优于各种网络拓扑的现有最先进的算法。最后，我们在集团后悔呈现紧密的网络依赖性最低限度。我们所提出的算法很简单，以实现和获得竞争性的经验性能。

translated by 谷歌翻译

Deep Multi-Scale Feature Learning for Defocus Blur Estimation

Ali Karaali , Naomi Harte , Claudio Rosito Jung

分类：计算机视觉 | 机器学习

2020-09-24

本文介绍了一种来自单个离焦图像的边缘散焦模糊估计方法。我们首先将位于深度不连续（称为深度边缘的边缘）的边缘区分从近似恒定的深度区域（称为模糊估计的被称为模糊估计的图案边缘）的边缘中的深度不连续性（含义模糊估计是模糊的）。然后，我们仅估计图案边缘的散焦模糊量，并探索基于引导滤波器的内插方案，该导向滤波器防止检测到的深度边缘的数据传播，以获得具有明确定义的对象边界的密集模糊图。两个任务（边缘分类和模糊估计）由深度卷积神经网络（CNNS）执行，该网络（CNN）共享权重以从边缘位置为中心的多尺度补丁学习有意义的本地特征。在自然散焦的图像上的实验表明，该方法提出了优异的最先进（SOTA）方法的定性和定量结果，在运行时间和准确度之间具有良好的折衷。

translated by 谷歌翻译

Unsupervised Learning of Lagrangian Dynamics from Images for Prediction and Control

Yaofeng Desmond Zhong , Naomi Ehrich Leonard

分类：机器学习 | (统计)机器学习

2020-07-03

用神经网络对物理系统的动力学建模的最新方法强制执行拉格朗日式或哈密顿结构，以改善预测和泛化。但是，当将坐标嵌入高维数据（例如图像）中时，这些方法要么失去解释性，要么只能应用于一个特定示例。我们介绍了一种新的无监督神经网络模型，该模型从图像中学习拉格朗日动态，并具有受益于预测和控制的解释性。该模型在广义坐标上渗透Lagrangian动力学，这些动力学是通过坐标感知的变异自动编码器（VAE）同时学习的。 VAE旨在说明由飞机中多个刚体组成的物理系统的几何形状。通过推断可解释的拉格朗日动力学，该模型学习了物理系统属性，例如动力学和势能，从而可以长期预测图像空间中的动力学和基于能量控制器的合成。

translated by 谷歌翻译